Máy học véc tơ hỗ trợ là gì? Các công bố khoa học về Máy học véc tơ hỗ trợ

Máy học véc tơ hỗ trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng trong lĩnh vực học máy để xây dựng mô hình dự đoán và phân l...

Máy học véc tơ hỗ trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng trong lĩnh vực học máy để xây dựng mô hình dự đoán và phân loại. Thuật toán này dựa trên cơ sở ý tưởng tìm kiếm một ranh giới phân chia (đường phân chia) tối ưu giữa các điểm dữ liệu thuộc vào các nhóm khác nhau.

Máy học véc tơ hỗ trợ cố gắng tối đa hoá khoảng cách giữa đường phân chia và các điểm dữ liệu gần nhất, có tên gọi là vector hỗ trợ. Thuật toán sử dụng các phép biến đổi không gian (kernel) để có thể tìm được đường phân chia tối ưu ngay cả khi dữ liệu không phân chia tuyến tính được.

Với tính linh hoạt trong việc xử lý dữ liệu, SVM có thể được áp dụng trong nhiều bài toán khác nhau như phân loại hình ảnh, nhận dạng chữ viết tay, phân loại văn bản, và nhiều ứng dụng khác.
Để hiểu chi tiết hơn về máy học véc tơ hỗ trợ, hãy xem qua các khái niệm và các bước thực hiện cơ bản của thuật toán SVM:

1. Khái niệm căn bản:
- Vector hỗ trợ: Là các điểm dữ liệu gần nhất với đường phân chia (đường biên). Vector hỗ trợ quyết định vị trí và hình dạng của đường phân chia.
- Đường phân chia tối ưu: Là đường thẳng, mặt phẳng, hoặc siêu phẳng trong không gian n chiều, tách hoặc phân chia các điểm dữ liệu thuộc vào các nhóm khác nhau. Mục tiêu của SVM là tìm ra đường phân chia tối ưu có thể phân loại đúng nhưng còn đảm bảo độ tổng quát cao (không bị overfitting).

2. Bước thực hiện cơ bản:
- Chuẩn bị dữ liệu: Dữ liệu huấn luyện (training data) cần được chuẩn bị trước. Mỗi điểm dữ liệu sẽ được biểu diễn dưới dạng véc tơ. Nếu dữ liệu là không phân chia tuyến tính, một phép biến đổi không gian (kernel) sẽ được sử dụng để biến đổi dữ liệu vào một không gian mới có thể phân chia tuyến tính.
- Xây dựng mô hình: Mục tiêu là tìm ra đường phân chia tối ưu. Đường phân chia tối ưu sẽ được xác định bằng cách tìm kiếm đường biên (biên cực đại) sao cho khoảng cách từ đường biên đến các điểm dữ liệu gần nhất là lớn nhất.
- Học mô hình: Thuật toán SVM sẽ tối ưu hóa các thông số của mô hình bằng cách giải một bài toán tối ưu hóa. Mục tiêu là tìm ra các trọng số tối ưu cho mô hình, đồng thời xác định các vector hỗ trợ.
- Dự đoán: Sau khi mô hình đã được huấn luyện, nó có thể được sử dụng để dự đoán nhãn của các điểm dữ liệu mới. Dự đoán dựa trên việc so sánh vị trí của điểm dữ liệu mới với đường phân chia tối ưu đã xác định.

Trên thực tế, thuật toán SVM có thể được tùy chỉnh bằng cách thay đổi các thông số như kernel (linear, polynomial, RBF, sigmoid,...), thông số C (khi xác định độ ràng buộc cho các điểm dữ liệu) và thông số gamma (trong kernel RBF). Những thay đổi này có thể ảnh hưởng đến hiệu suất của mô hình SVM.

Danh sách công bố khoa học về chủ đề "máy học véc tơ hỗ trợ":

Sử dụng lí thuyết tập thô cho việc tạo cấu trúc cây Hah trong phân lớp đa lớp
Trong bài báo này, chúng tôi sử dụng chiến lược phân lớp Half- against-Half và bộ phân lớp nhị phân Support Vector Machines (SVMs) cho bài toán phân lớp đa lớp. Trong đó, để tạo cấu trúc cây cho HAH, chúng tôi đề xuất một thuật toán dựa trên lí thuyết tập thô (Rough Set Theory – RST). Kết quả của thuật toán sẽ được so sánh với một số chiến lược phân đa lớp phổ biến dựa trên bộ phân lớp SVMs. Normal 0 false false false EN-US X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Calibri","sans-serif";}
#lí thuyết tập thô #Haft-against-Haft #máy học hỗ trợ vector
Mô hình phân loại chất lượng nguồn nước hồ chứa bằng sự kết hợp chiến lược một đối một và bình phương máy học véc tơ hỗ trợ
Một hệ thống quản lý nguồn nước không hiệu quả có thể trở thành một trong những bất lợi chính cho quá trình phát triển bền vững của loài người. Vì vậy, mô hình phân loại chất lượng nguồn nước tại hồ chứa là rất cần thiết để giải quyết vấn đề môi trường và đây cũng là công cụ hữu ích cho sự cân bằng quá trình ô nhiễm. Bài báo này đề xuất mô hình phân loại chất lượng nguồn nước tại hồ chứa dựa vào sự kết hợp giữa chiến lược một đối một và bình phương máy học vec-tơ hỗ trợ. Bài báo phân tích và so sánh kết quả đạt được với những mô hình và thuật toán phân loại khác để chứng minh sự phù hợp của mô hình được đề xuất trong việc phân loại chất lượng nguồn nước hồ chứa với độ chính xác đạt được là 92.196%
#Hệ thống quản lý #mô hình phân loại #chất lượng nguồn nước hồ chứa #một đối một #bình phương máy học vec-tơ hỗ trợ
Đánh giá các thuật toán phân loại trong việc dự đoán những rủi ro về tài chính
Rủi ro tài chính luôn là đề tài gây hứng thú cho các nhà nghiên cứu và những nhà đầu tư. Vì vậy, việc dự đoán những rủi ro tài chính trong nền kinh tế hiện nay là cần thiết. Và cách lựa chọn được một hay nhiều lớp phân loại là nhiệm vụ quan trọng. Mục đích bài báo này là sử dụng ba thuật toán phổ biến của phương pháp máy học; máy học vecto hỗ trợ, cây quyết định và thuật toán Naïve Bayes; để dự đoán khả năng rủi ro của ba bộ dữ liệu tài chính - Qualitative Bankruptcy, Japanese bankruptcy and Australian credit card application. Kết quả cho thấy rằng thuật toán SVM cho kết quả phân loại tốt nhất và đáng tin cậy với độ chính xác lần lượt cho ba bộ dữ liệu Qualitative Bankruptcy, Japanese bankruptcy and Australian credit card application là 99.6000%, 87.652% và 86.783%. Tuy nhiên, kết quả của hai thuật toán còn lại cho ba bộ dữ liệu trên cũng đạt kết quả tốt. Nghiên cứu này còn muốn chứng minh tính hiệu quả của phương pháp máy học trong việc phân loại rủi ro tài chính.
#Rủi ro tài chính #kỹ thuật học máy #máy học vecto hỗ trợ #cây quyết định #Naïve Bayes
Dự báo sự tiêu thụ điện ở thành phố Đà Nẵng sử dụng mô hình kết hợp cửa sổ dịch chuyển và hồi quy máy học được tối ưu bởi trí tuệ bầy đàn
Dự báo điện năng đóng vai trò quan trọng trong hệ thống quản lý năng lượng. Một công cụ dự báo hiệu quả sẽ hỗ trợ các công ty đưa ra các quyết định về mua, sản xuất điện, truyền tải, và phát triển hạ tầng. Nghiên cứu này phát triển một mô hình dự báo điện năng kết hợp lý thuyết cửa sổ dịch chuyển và máy học véc-tơ hỗ trợ (LSSVR) được tối ưu bởi thuật toán con đom đóm (FA). Cửa sổ dịch chuyển được sử dụng để lựa chọn dữ liệu lịch sử hợp lý cho dự báo. Thuật toán con đom đóm nhằm tối ưu tham số của LSSVR để cải thiện độ chính xác dự báo. Một bộ dữ liệu thực tế được thu thập ở thành phố Đà Nẵng được sử dụng để kiểm chứng khả năng dự báo của mô hình đề xuất MFA-LSSVR. Kết quả thực nghiệm cho thấy mô hình đề xuất có khả năng dự báo tốt hơn mô hình moving-window LSSVR và moving-window ARIMA. Kết quả của nghiên cứu này cung cấp một công cụ tiềm năng và hiệu quả để dự báo sự tiêu thụ điện năng.
#Sự tiêu thụ điện #độ chính xác dự báo #lý thuyết cửa số dịch chuyển #trí tuệ bầy đàn #máy học véc-tơ hỗ trợ
Ứng dụng mô hình máy học Véc-tơ tựa (SVM) trong phân tích dữ liệu điểm sinh viên
Bài báo này đề xuất ứng dụng mô hình kết hợp máy học véc-tơ tựa và hệ thống mờ trong việc trích xuất luật mờ từ dữ liệu điểm sinh viên. Máy học Véc-tơ tựa (SVMs) và hệ thống luật mờ có sự tương đương nhau với một số điều kiện nhất định. Trên cơ sở phân tích sự tương đương giữa mô hình máy học Véc-tơ tựa với mô hình mờ (Fuzzy model), chúng tôi đề xuất một mô hình tích hợp SVMs và Fuzzy model để trích xuất luật mờ từ kết quả huấn luyện SVMs. Thuật toán f-SVM cho phép sản xuất được các luật mờ từ dữ liệu huấn luyện. Dữ liệu điểm thực tế của sinh viên được sử dụng để kiểm tra khả năng thực hiện của mô hình đề xuất. Tập luật mờ trích xuất được từ tập dữ liệu huấn luyện bằng thuật toán f-SVM, sẽ được sử dụng để suy luận trên tập dữ liệu thử nghiệm.
#Máy học véc-tơ tựa #mô hình mờ #khai phá luật kết hợp #khai phá dữ liệu #luật mờ
Một bộ phân loại lai dựa trên máy hỗ trợ vector và thuật toán Jaya cho phân loại ung thư vú Dịch bởi AI
Neural Computing and Applications - - 2022
Quyết định của các chuyên gia và việc đánh giá dữ liệu của bệnh nhân là những phần quan trọng nhất ảnh hưởng đến phân tích ung thư vú. Để phát hiện sớm ung thư vú, nhiều kỹ thuật học máy không chỉ hỗ trợ trong việc kiểm tra và chẩn đoán nhanh chóng dữ liệu y tế mà còn giảm thiểu các lỗi tiềm ẩn có thể xảy ra do các nhà quyết định thiếu kinh nghiệm hoặc không có kỹ năng. Máy hỗ trợ vector (SVM) là một trong những bộ phân loại nổi tiếng đã đóng góp quan trọng cho lĩnh vực phân loại ung thư. Tuy nhiên, cấu hình của các hàm lõi khác nhau và các tham số của chúng có thể ảnh hưởng đáng kể đến hiệu suất của bộ phân loại SVM. Để cải thiện hơn nữa độ chính xác phân loại của bộ phân loại SVM cho chẩn đoán ung thư vú, một phương pháp phân loại ung thư thông minh được đề xuất dựa trên việc chọn một tập hợp đặc trưng và tối ưu hóa các tham số liên quan (tức là tham số hệ số hình phạt ($$c$$) và tham số hàm lõi ($$ \gamma$$) của bộ phân loại SVM đồng thời thông qua một thuật toán thông minh sử dụng thuật toán Jaya. Sau đó, phương pháp này (Jaya-SVM) được áp dụng để xác định chính xác tập dữ liệu ung thư vú, bao gồm 699 mẫu, trong đó 458 mẫu là u lành và 241 mẫu là u ác tính. Hơn nữa, để đánh giá hiệu quả của bộ phân loại Jaya-SVM được đề xuất, nó được so sánh về mức độ phức tạp tính toán và độ chính xác phân loại với một số bộ phân loại metaheuristic tổ hợp khác, bao gồm thuật toán di truyền (GA), tiến hóa vi phân (DE), tối ưu hóa bầy đàn (PSO) và bộ phân loại SVM dựa trên tìm kiếm chim cú (CS). Bên cạnh đó, tập dữ liệu ung thư vú Coimbra lấy từ thư viện UCI được sử dụng để xác thực hiệu quả của phương pháp được đề xuất. Các kết quả được trình bày, giải thích và các kết luận được rút ra.
#ung thư vú #máy hỗ trợ vector #thuật toán Jaya #phân loại ung thư #học máy
Phân đoạn Thông tin Đường biên Mờ của Ảnh Dựa trên Thị giác Máy tính và Học Máy Dịch bởi AI
Springer Science and Business Media LLC - Tập 21 - Trang 1-15 - 2023
Phân đoạn hình ảnh là một vấn đề then chốt trong lĩnh vực thị giác máy. Mục tiêu cốt lõi của nó là tách biệt mục tiêu và nền trong khu vực quan tâm từ hình ảnh, và ảnh hưởng trực tiếp đến độ chính xác của các phép toán tiếp theo như nhận diện mục tiêu và hiểu hình ảnh. Trong vài thập kỷ qua, đã có nhiều thuật toán phân đoạn hình ảnh tốt. Trong những năm gần đây, phương pháp học sâu đại diện cho học máy đã đạt được nhiều tiến bộ vượt bậc trong lĩnh vực phân đoạn hình ảnh. Bài báo này đã xem xét một số thuật toán phân đoạn hình ảnh thường được sử dụng dựa trên học máy, và thực hiện các nghiên cứu lý thuyết cũng như thực nghiệm. Bài báo cũng dự báo triển vọng ứng dụng của học máy trong phân đoạn hình ảnh. Các phương pháp phân đoạn hình ảnh hiện có chủ yếu được chia thành các loại sau: phương pháp phân đoạn dựa trên ngưỡng, phương pháp phân đoạn dựa trên vùng, phương pháp phân đoạn dựa trên cạnh, và các phương pháp phân đoạn dựa trên lý thuyết cụ thể. Trong những năm gần đây, với sự tiến bộ nhanh chóng của công nghệ thị giác máy tính, các yêu cầu về độ chính xác của việc phân đoạn thông tin đường biên hình ảnh đã ngày càng trở nên cao. Lý do chính cho việc phân đoạn hình ảnh là để có được thông tin mục tiêu tốt hơn. Tuy nhiên, do các điều kiện nhiễu như ánh sáng và tiếng ồn, phân đoạn thông tin đường biên mờ trong hình ảnh đã trở thành điểm khó khăn nhất trong sự phát triển của công nghệ thị giác máy tính. Trong thí nghiệm so sánh các thuật toán, kết quả cho thấy trong tập huấn luyện, thời gian phản hồi của thuật toán Mạng Nơ-ron Sâu (DNN), thuật toán Phân tích Cụm (CA) và thuật toán Máy Vector Hỗ trợ (SVM) lần lượt là 13,72 giây, 16,88 giây và 17,29 giây khi số lượng mẫu là 150. Trong tập kiểm tra, khi số lượng mẫu là 50, tỷ lệ nhận diện của thuật toán DNN đạt 93,7%; tỷ lệ nhận diện của thuật toán CA đạt 87,9%; tỷ lệ nhận diện của thuật toán SVM đạt 84,3%. Do đó, nghiên cứu về phân đoạn thông tin đường biên mờ của hình ảnh dựa trên thị giác máy tính và học máy là rất cần thiết.
#Thị giác máy #phân đoạn hình ảnh #học máy #mạng nơ-ron sâu #phân tích cụm #máy vector hỗ trợ.
Tối ưu hóa mô hình mờ TSK trích xuất từ máy học véc-tơ hỗ trợ hồi quy với tham số epsilon
Mô hình mờ TSK và mô hình máy học véc-tơ hỗ trợ hồi quy có sự tương đương nhau trong một số điều kiện nhất định. Bằng cách thỏa mãn các điều kiện đề đồng nhất các hàm đầu ra của mô hình mờ TSK và máy học véc-tơ hỗ trợ hồi quy, chúng ta có thể xây dựng một thuật toán cho phép trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ trợ. Bài báo này không những đưa ra thuật toán cho phép trích xuất mô hình mờ TSK từ máy học véc tơ hỗ trợ mà còn đề xuất một giải pháp cho phép tối ưu hóa mô hình mờ nhận được thông qua việc điều chỉnh tham số ε. Việc điều chỉnh tham số ε sẽ cho phép trích xuất được mô hình vừa đảm bảo tính chính xác trong dự đoán đồng thời có thể giảm độ phức tạp và tăng “tính diễn dịch” của mô hình. Hiệu quả của giải pháp đề xuất được đánh giá thông qua các kết quả thực nghiệm và có sự so sánh với kết quả của một số mô hình khác.
#mô hình mờ #mô hình mờ TSK #luật mờ #máy học véc-tơ hỗ trợ #máy học véc-tơ hỗ trợ hồi quy
Tập hợp giữa học sâu và học máy trong việc phân loại số viết tay tiếng Hindi Dịch bởi AI
Journal of Engineering and Applied Science - Tập 70 - Trang 1-21 - 2023
Với sự đa dạng của các yếu tố, bao gồm hình dạng, kích thước, độ lệch và hướng của các số viết tay, việc nhận diện chúng bằng máy tính trở thành một thách thức khó khăn đối với các nhà nghiên cứu trong lĩnh vực nhận diện mẫu. Do sự phong phú của các đường cong và các hình dạng tương tự của các ký hiệu, việc nhận diện số Devnagari có thể làm tăng mức độ khó khăn của quá trình nhận diện. Phương pháp phân loại chi phí thấp được đề xuất để thu thập các đặc điểm tinh vi từ những hình ảnh số đã sử dụng các mô hình học sâu chuẩn, bao gồm VGG-16Net, VGG-19Net, ResNet-50 và Inception-v3, nhằm giải quyết các vấn đề này. Phân tích thành phần chính, một phương pháp giảm chiều mạnh mẽ, đã được sử dụng để giảm thiểu số chiều trong thông tin mà các mô hình mạng nơ-ron tích chập sâu đã được đào tạo trước đó cung cấp. Phương pháp cải thiện độ chính xác nhận diện thông qua việc kết hợp các đặc điểm cũng được cung cấp trong kế hoạch. Một thuật toán học máy: máy vector hỗ trợ đã được áp dụng cho nhiệm vụ nhận diện do khả năng phân biệt giữa các mẫu thuộc các lớp riêng biệt. Hệ thống đạt được độ chính xác nhận diện lên đến 99,72% và đã chứng minh hiệu quả của việc áp dụng các phương pháp học máy kết hợp và học sâu.
#nhận diện số viết tay #học sâu #học máy #mô hình học sâu #số Devnagari #phân tích thành phần chính #máy vector hỗ trợ
ỨNG DỤNG MÁY HỌC VECTOR HỖ TRỢ SVM TRONG DỰ ĐOÁN CƠN ĐỘNG KINH
Tạp chí khoa học và công nghệ năng lượng - Tập 21 Số 21 - Trang 39 - 2020
Bệnh động kinh được xem là căn bệnh liên quan đến rối loạn trong não phổ biến thứ hai và ảnh hưởng đến khoảng 1% dân số thế giới. Đặc trưng của động kinh là sự xuất hiện bất chợt và mất kiểm soát của cơn co giật (cơn động kinh). Trong bài báo này, chúng tôi đề xuất một phương pháp sử dụng máy học vector hỗ trợ SVM (Support Vector Machine) để dự đoán cơn động kinh dựa trên các bản ghi tín hiệu điện não đồ EEG (Electroencephalography). Phương pháp này sử dụng các đặc trưng đơn biến của tín hiệu EEG nhằm phân loại bốn trạng thái tín hiệu EEG (bình thường, tiền động kinh, động kinh và sau động kinh). Việc dự đoán chính xác cơn động kinh phụ thuộc vào khả năng nhận dạng/phân biệt trạng thái tiền động kinh (pre-ictal) với ba trạng thái còn lại. Các kết quả mô phỏng với cơ sở dữ liệu động kinh của Đại học Freiburg cho thấy tính hữu dụng của phương pháp đề xuất.
Tổng số: 17   
  • 1
  • 2